智能论文笔记

MONet: Multi-scale Overlap Network for Duplication Detection in Biomedical Images

Ekraam Sabir , Soumyaroop Nandi , Wael AbdAlmageed , Prem Natarajan

分类：计算机视觉 | 人工智能

2022-07-19

对生物医学图像进行操纵以虚假陈述实验结果，困扰着生物医学界。对该问题的最新兴趣导致了数据集和相关任务的策划，以促进生物医学法医方法的发展。其中，最大的操纵检测任务侧重于检测图像之间的重复区域。基于自然图像训练的法医模型的传统计算机视觉并非旨在克服生物医学图像带来的挑战。我们提出了一个多尺度重叠检测模型，以检测重复的图像区域。我们的模型的结构是从层次上找到重复，以减少补丁操作的数量。它总体上和多个生物医学图像类别都达到了最先进的性能。

translated by 谷歌翻译

Word to Sentence Visual Semantic Similarity for Caption Generation: Lessons Learned

Ahmed Sabir

分类：自然语言处理 | 计算机视觉

2022-09-26

本文着重于增强图像捕获生成系统生成的字幕。我们建议通过选择与图像的最紧密相关的输出，而不是模型产生的最可能的输出来改善字幕生成系统的方法。我们的模型从视觉上下文的角度修改了语言生成的输出光束搜索。我们采用单词和句子级别的视觉语义度量，将适当的标题与图像中的相关信息匹配。建议的方法可以作为基于后处理的方法应用于任何字幕系统。

translated by 谷歌翻译

Uncertainty-Aware Tightly-Coupled GPS Fused LIO-SLAM

Sabir Hossain , Xianke Lin

分类：机器人

2022-09-20

交付机器人旨在获得高精度以促进完全自主权。需要一个精确的人行行周围环境的三维点云图来估计自定位。有或没有循环结束方法，由于传感器漂移，较大的城市或城市地图映射后累积误差会逐渐增加。因此，使用漂移或错位的地图存在很高的风险。本文提出了一种融合GPS更新3D点云并消除累积错误的技术。提出的方法与其他现有方法显示了定量比较和定性评估的出色结果。

translated by 谷歌翻译

Belief Revision based Caption Re-ranker with Visual Semantic Information

Ahmed Sabir , Francesc Moreno-Noguer , Pranava Madhyastha , Lluís Padró

分类：计算机视觉 | 自然语言处理

2022-09-16

在这项工作中，我们专注于改善图像捕获生成系统生成的字幕。我们提出了一种新型的重新排列方法，该方法利用视觉声音措施来确定最大程度地捕获图像中视觉信息的理想标题。我们的重新级别使用了信念修订框架（Blok等，2003），通过明确利用所描绘的标题和视觉上下文之间的语义相关性来校准顶级字幕的原始可能性。我们的实验证明了我们方法的实用性，我们观察到我们的重新级别可以增强典型的图像捕获系统的性能，而无需进行任何额外的培训或微调。

translated by 谷歌翻译

High-Definition Map Generation Technologies For Autonomous Driving: A Review

Zhibin Bao , Sabir Hossain , Haoxiang Lang , Xianke Lin

分类：机器人 | 计算机视觉

2022-06-11

在过去几年中，自动驾驶一直是最受欢迎，最具挑战性的主题之一。在实现完全自治的道路上，研究人员使用了各种传感器，例如LIDAR，相机，惯性测量单元（IMU）和GPS，并开发了用于自动驾驶应用程序的智能算法，例如对象检测，对象段，障碍，避免障碍物，避免障碍物和障碍物，以及路径计划。近年来，高清（HD）地图引起了很多关注。由于本地化中高清图的精度和信息水平很高，因此它立即成为自动驾驶的关键组成部分之一。从Baidu Apollo，Nvidia和TomTom等大型组织到个别研究人员，研究人员创建了用于自主驾驶的不同场景和用途的高清地图。有必要查看高清图生成的最新方法。本文回顾了最新的高清图生成技术，这些技术利用了2D和3D地图生成。这篇评论介绍了高清图的概念及其在自主驾驶中的有用性，并详细概述了高清地图生成技术。我们还将讨论当前高清图生成技术的局限性，以激发未来的研究。

translated by 谷歌翻译